# -*- coding: utf-8 -*-#
"""
@File : 02-Embedding向量模型的使用（文本转向量）.py
@Description :
中文领域首选：合合信息acge_text_embedding
评测表现：
C-MTEB中文榜第一：在31个中文数据集上综合得分领先，涵盖检索、分类、聚类等任务9。
可变输出维度：支持动态调整向量维度，适配不同存储和计算需求9。
技术特性：
基于Matryoshka Representation Learning，优化长文档信息抽取精度。
输入长度支持1024 token，满足多数中文场景需求9。

@Author : Le.Qing
@Create Time : 2025-05-08 10:28
"""
from langchain_ollama import OllamaEmbeddings


def embeddingLLM():
    return OllamaEmbeddings(base_url="http://localhost:11434", model="chevalblanc/acge_text_embedding")


model = embeddingLLM()
input_texts = [
    "中国的首都是哪里",
    "你喜欢去哪里旅游",
    "北京",
    "今天中午吃什么"
]
embeddings = model.embed_documents(input_texts)
print(f"第一个句子向量为: {embeddings[0]}")
